智能论文笔记

When Neural Networks Fail to Generalize? A Model Sensitivity Perspective

Jiajin Zhang , Hanqing Chao , Amit Dhurandhar , Pin-Yu Chen , Ali Tajer , Yangyang Xu , Pingkun Yan

分类：计算机视觉 | 人工智能

2022-12-01

Domain generalization (DG) aims to train a model to perform well in unseen domains under different distributions. This paper considers a more realistic yet more challenging scenario,namely Single Domain Generalization (Single-DG), where only a single source domain is available for training. To tackle this challenge, we first try to understand when neural networks fail to generalize? We empirically ascertain a property of a model that correlates strongly with its generalization that we coin as "model sensitivity". Based on our analysis, we propose a novel strategy of Spectral Adversarial Data Augmentation (SADA) to generate augmented images targeted at the highly sensitive frequencies. Models trained with these hard-to-learn samples can effectively suppress the sensitivity in the frequency space, which leads to improved generalization performance. Extensive experiments on multiple public datasets demonstrate the superiority of our approach, which surpasses the state-of-the-art single-DG methods.

translated by 谷歌翻译

Efficient and Accurate Quantized Image Super-Resolution on Mobile NPUs, Mobile AI & AIM 2022 challenge: Report

Andrey Ignatov , Radu Timofte , Maurizio Denna , Abdel Younes , Ganzorig Gankhuyag , Jingang Huh , Myeong Kyun Kim , Kihwan Yoon , Hyeon-Cheol Moon , Seungho Lee

分类：计算机视觉

2022-11-07

Image super-resolution is a common task on mobile and IoT devices, where one often needs to upscale and enhance low-resolution images and video frames. While numerous solutions have been proposed for this problem in the past, they are usually not compatible with low-power mobile NPUs having many computational and memory constraints. In this Mobile AI challenge, we address this problem and propose the participants to design an efficient quantized image super-resolution solution that can demonstrate a real-time performance on mobile NPUs. The participants were provided with the DIV2K dataset and trained INT8 models to do a high-quality 3X image upscaling. The runtime of all models was evaluated on the Synaptics VS680 Smart Home board with a dedicated edge NPU capable of accelerating quantized neural networks. All proposed solutions are fully compatible with the above NPU, demonstrating an up to 60 FPS rate when reconstructing Full HD resolution images. A detailed description of all models developed in the challenge is provided in this paper.

translated by 谷歌翻译

MUI-TARE: Multi-Agent Cooperative Exploration with Unknown Initial Position

Jingtian Yan , Xingqiao Lin , Zhongqiang Ren , Shiqi Zhao , Jieqiong Yu , Chao Cao , Peng Yin , Ji Zhang , Sebastian Scherer

分类：机器人 | 人工智能

2022-09-22

对具有代理商初始位置未知的有限3D环境的多代理探索是一个具有挑战性的问题。它需要快速探索环境，并坚定合并代理商构建的子图。我们认为现有方法是侵略性或保守的：在检测到重叠时，积极的策略合并了两种由不同代理构建的子图，这可能导致由于对重叠的错误阳性检测而导致不正确的合并，因此是如此。不健全。保守策略指导一个代理人在合并之前重新审视另一个代理商的过量验证历史轨迹，这可以降低由于对同一空间的反复探索而引起的勘探效率。为了巧妙地平衡子图合并和勘探效率的鲁棒性，我们为基于激光雷达的多代理探索开发了一种新方法，该方法可以指导一个代理商以\ emph {自适应}方式重复另一个代理商的轨迹子图合并过程的指标。此外，我们的方法通过计划合并子图的代理人共同计划，以进一步提高勘探效率，以\ emph {Cooperative}方式将最近的单格分层勘探策略扩展到多个代理。我们的实验表明，我们的方法平均比基线高出50 \％，同时稳固地合并子映射。

translated by 谷歌翻译

M^2-3DLaneNet: Multi-Modal 3D Lane Detection

Yueru Luo , Xu Yan , Chaoda Zheng , Chao Zheng , Shuqi Mei , Tang Kun , Shuguang Cui , Zhen Li

分类：计算机视觉

2022-09-13

由于其稀疏和细长的性质，估算3D空间中准确的车道线仍然具有挑战性。在这项工作中，我们提出了M^2-3dlanenet，这是一个有效3D车道检测的多模式框架。旨在集成来自多传感器的互补信息，M^2-3dlanenet首先将多模式特征提取具有模态特异性骨架，然后将它们融合在统一的鸟眼视图（BEV）空间中。具体而言，我们的方法由两个核心组成部分组成。 1）要获得准确的2D-3D映射，我们提出了自上而下的BEV生成。其中，使用线条限制的变形（LRDA）模块可用于以自上而下的方式有效地增强图像特征，从而充分捕获车道的细长特征。之后，它使用深度感知的举重将2D锥体特征投入到3D空间中，并通过枕形生成BEV特征。 2）我们进一步提出了自下而上的BEV融合，该融合通过多尺度的级联注意力汇总了多模式特征，从而集成了来自摄像头和激光雷达传感器的互补信息。足够的实验证明了M^2-3dlanenet的有效性，该实验的有效性超过了先前的最先进方法，即在OpenLane数据集上提高了12.1％的F1-SCORE改善。

translated by 谷歌翻译

A Comprehensive Review of Digital Twin -- Part 2: Roles of Uncertainty Quantification and Optimization, a Battery Digital Twin, and Perspectives

Adam Thelen , Xiaoge Zhang , Olga Fink , Yan Lu , Sayan Ghosh , Byeng D. Youn , Michael D. Todd , Sankaran Mahadevan , Chao Hu , Zhen Hu

分类：机器学习

2022-08-27

作为行业4.0时代的一项新兴技术，数字双胞胎因其承诺进一步优化流程设计，质量控制，健康监测，决策和政策制定等，通过全面对物理世界进行建模，以进一步优化流程设计，质量控制，健康监测，决策和政策，因此获得了前所未有的关注。互连的数字模型。在一系列两部分的论文中，我们研究了不同建模技术，孪生启用技术以及数字双胞胎常用的不确定性量化和优化方法的基本作用。第二篇论文介绍了数字双胞胎的关键启示技术的文献综述，重点是不确定性量化，优化方法，开源数据集和工具，主要发现，挑战和未来方向。讨论的重点是当前的不确定性量化和优化方法，以及如何在数字双胞胎的不同维度中应用它们。此外，本文介绍了一个案例研究，其中构建和测试了电池数字双胞胎，以说明在这两部分评论中回顾的一些建模和孪生方法。 GITHUB上可以找到用于生成案例研究中所有结果和数字的代码和预处理数据。

translated by 谷歌翻译

A Comprehensive Review of Digital Twin -- Part 1: Modeling and Twinning Enabling Technologies

Adam Thelen , Xiaoge Zhang , Olga Fink , Yan Lu , Sayan Ghosh , Byeng D. Youn , Michael D. Todd , Sankaran Mahadevan , Chao Hu , Zhen Hu

分类：人工智能 | 机器学习

2022-08-26

作为行业4.0时代的一项新兴技术，数字双胞胎因其承诺进一步优化流程设计，质量控制，健康监测，决策和政策制定等，通过全面对物理世界进行建模，以进一步优化流程设计，质量控制，健康监测，决策和政策，因此获得了前所未有的关注。互连的数字模型。在一系列两部分的论文中，我们研究了不同建模技术，孪生启用技术以及数字双胞胎常用的不确定性量化和优化方法的基本作用。第一篇论文介绍了目前从事这一研究领域的许多学科的数字双胞胎趋势的详尽文献综述。然后，通过将数据分类为两个主要类别：基于数据流的方向，将数字双胞胎建模和双胞胎启用技术分为两个主要类别：物理到虚拟和虚拟物理。最后，本文在未来十年中提供了有关数字双技术轨迹的观点，并介绍了一些新兴研究领域，这些领域可能在未来的数字双胞胎研究中很可能有很大的用途。在本综述的第二部分中，讨论了不确定性量化和优化的作用，展示了电池数字双胞胎，并共享了数字双胞胎未来的更多观点。

translated by 谷歌翻译

A Multifaceted Benchmarking of Synthetic Electronic Health Record Generation Models

Chao Yan , Yao Yan , Zhiyu Wan , Ziqi Zhang , Larsson Omberg , Justin Guinney , Sean D. Mooney , Bradley A. Malin

分类：机器学习 | 人工智能

2022-08-02

合成健康数据在共享数据以支持生物医学研究和创新医疗保健应用的发展时有可能减轻隐私问题。基于机器学习，尤其是生成对抗网络（GAN）方法的现代方法生成的现代方法继续发展并表现出巨大的潜力。然而，缺乏系统的评估框架来基准测试方法，并确定哪些方法最合适。在这项工作中，我们引入了一个可推广的基准测试框架，以评估综合健康数据的关键特征在实用性和隐私指标方面。我们将框架应用框架来评估来自两个大型学术医疗中心的电子健康记录（EHRS）数据的合成数据生成方法。结果表明，共享合成EHR数据存在公用事业私人关系权衡。结果进一步表明，在每个用例中，在所有标准上都没有明确的方法是最好的，这使得为什么需要在上下文中评估合成数据生成方法。

translated by 谷歌翻译

Ithaca365: Dataset and Driving Perception under Repeated and Challenging Weather Conditions

Carlos A. Diaz-Ruiz , Youya Xia , Yurong You , Jose Nino , Junan Chen , Josephine Monica , Xiangyu Chen , Katie Luo , Yan Wang , Marc Emond

分类：计算机视觉

2022-08-01

由于大规模数据集的可用性，通常在特定位置和良好的天气条件下收集的大规模数据集，近年来，自动驾驶汽车的感知进展已加速。然而，为了达到高安全要求，这些感知系统必须在包括雪和雨在内的各种天气条件下进行稳健运行。在本文中，我们提出了一个新数据集，以通过新颖的数据收集过程启用强大的自动驾驶 - 在不同场景（Urban，Highway，乡村，校园），天气，雪，雨，阳光下，沿着15公里的路线反复记录数据），时间（白天/晚上）以及交通状况（行人，骑自行车的人和汽车）。该数据集包括来自摄像机和激光雷达传感器的图像和点云，以及高精度GPS/ins以在跨路线上建立对应关系。该数据集包括使用Amodal掩码捕获部分遮挡和3D边界框的道路和对象注释。我们通过分析基准在道路和对象，深度估计和3D对象检测中的性能来证明该数据集的独特性。重复的路线为对象发现，持续学习和异常检测打开了新的研究方向。链接到ITHACA365：https：//ithaca365.mae.cornell.edu/

translated by 谷歌翻译

Subgraph Neighboring Relations Infomax for Inductive Link Prediction on Knowledge Graphs

Xiaohan Xu , Peng Zhang , Yongquan He , Chengpeng Chao , Chaoyang Yan

分类：人工智能 | 机器学习

2022-07-28

知识图的归纳链路预测旨在预测未见实体之间的缺失联系，而那些未在训练阶段显示的实体。大多数以前的作品都学习实体的特定实体嵌入，这些实体无法处理看不见的实体。最近的几种方法利用封闭子图来获得归纳能力。但是，所有这些作品仅在没有完整的邻近关系的情况下考虑子图的封闭部分，这导致了忽略部分邻近关系的问题，并且很难处理稀疏的子图。为了解决这个问题，我们提出了SNRI子图邻近关系Infomax，它足够从两个方面利用完整的相邻关系：节点特征的相邻关系特征和稀疏子图的相邻关系路径。为了进一步以全球方式建模邻近关系，我们对知识图进行创新的相互信息（MI）最大化。实验表明，SNRI在归纳链路预测任务上的大幅度优于现有的最新方法，并验证以全局方式探索完整的邻近关系的有效性，以表征节点特征和在稀疏子分类上的理由。

translated by 谷歌翻译

Regression Metric Loss: Learning a Semantic Representation Space for Medical Images

Hanqing Chao , Jiajin Zhang , Pingkun Yan

分类：计算机视觉

2022-07-12

回归在估计各种临床风险或测量评分的许多医学成像应用中起着至关重要的作用。尽管已经研究了医学图像分类任务中深层神经网络的培训策略和损失功能，但回归任务的选项非常有限。关键挑战之一是，很难解释由现有流行损失函数（如平方误差或L1损失）所学的高维特征表示。在本文中，我们提出了一种新颖的回归度量损失（RM-loss），该损失通过找到标签空间等均衡的表示歧管来赋予表示空间的语义含义。对两个回归任务的实验，即冠状动脉钙评分估计和骨骼年龄评估，表明RM-LOSS优于在性能和可解释性上的现有流行回归损失。代码可在https://github.com/dial-rpi/regression-metric-loss上找到。

translated by 谷歌翻译